Posición: El aprendizaje por refuerzo desplegado debe ser continuo
¿Por qué los agentes de RL desplegados deben aprender continuamente? Descubre las razones y ventajas frente al modelo entrenar-luego-arreglar.
¿Por qué los agentes de RL desplegados deben aprender continuamente? Descubre las razones y ventajas frente al modelo entrenar-luego-arreglar.